其他
中心成果 |《基于知识图谱的北京冬奥智能问答系统》项目成果介绍
导 语
项目介绍
《基于知识图谱的北京冬奥项目智能问答系统》项目由语言资源高精尖创新中心特聘研究员、中国科学院软件研究所孙乐研究员主持开展。项目于2018年2月立项,2020年9月开展结项工作。本项目以面向2022年北京冬奥会的冬奥项目智能问答系统为核心研究目标,立足于以智能化的手段普及冬奥项目知识,集中解决“冬奥知识碎片化”、“知识展示单一化”、“服务手段智能化不足”三大核心挑战,从而为语言资源高精尖创新中心的“语言通”智能服务和《北京冬奥会语言服务行动计划》的人机智能交换平台提供关键技术支撑。
针对“冬奥知识碎片化”挑战,项目构建了首个对外发布的大规模冬奥项目知识图谱资源,可为各类冬奥智能应用提供有力的资源支撑。针对“知识展示单一化”挑战,项目设计了立体化知识展示平台,为冬奥知识提供了不同粒度、不同视角的多种知识展示方式,使得用户可以更方便、快捷、全面地了解冬奥会知识。针对“服务手段智能化不足”挑战,项目研发了冬奥项目智能问答原型系统,为普及冬奥知识、宣传冬奥文化提供了一种智能化手段。资源成果
项目研发的资源类成果主要是大规模冬奥项目知识图谱资源。与冬奥会相关的知识分散在互联网的各个网站上,呈现出一种碎片化的局面。针对该挑战,项目组深入探索了各类数据挖掘与知识抽取、知识融合方法,从互联网上获取并融合国内外各类冬奥相关的知识资源,建设了一个包含179万知识点、完整覆盖5类冬奥核心实体(项目、赛会、运动员、比赛、参赛队)的北京冬奥项目知识图谱,不同类型的实体之间具有丰富的关联关系,为知识展示、智能知识问答等上层应用提供有力的资源支撑。
技术成果
1、立体化冬奥项目知识展示平台
项目组针对冬奥知识展示单一化问题,设计了多种类型的知识展示服务,为普及冬奥知识、宣传冬奥文化提供全方位、立体化手段。当前平台可提供的知识展示手段包括:知识浏览、文本查询、结构化知识查询、全景交互式知识查询等,使得用户可以更方便、快捷、全面地了解冬奥会知识。知识浏览
2、智能化冬奥项目问答原型系统(“小奥”智能问答系统)
针对冬奥知识服务精准化、智能化不足问题,项目研发了智能化冬奥项目智能问答原型系统(“小奥”智能问答系统)。系统采用自主研发的国际前沿深度学习语义解析模型,构建了精准的问句分析引擎。系统以微信公众号、小程序、网站入口等多种方式提供服务,接受文本和语音两种方式的自然语言问句输入,在准确地识别用户的问句意图之后,实时便捷地返回文本、图片等多种模态的答案。系统当前可以提供与历届冬奥会赛会、冬奥比赛项目、冬奥运动员、冬奥比赛成绩等相关知识相关的问答服务。成果入口